تحلیل درستنمایی ماکزیمم مدل رگرسیون لجستیک در حالتی که داده های متغیرهای پیشگو کامل نیستند ولی متغیرهای کمکی وجود دارند
Authors
Abstract:
Background and Objectives: Missing data exist in many studies, e.g. in regression models, and they decrease the model's efficacy. Many methods have been suggested for handling incomplete data: they have generally focused on missing outcome values. But covariate values can also be missing.Materials and Methods: In this paper we study the missing imputation by the EM algorithm and auxiliary variable and compare the result with case-complete analysis in a logistic regression model dealing with factors that influence the choice of the delivery method.Our data came from a cross-sectional study of factors associated with the choice of the delivery method in pregnant women. The sample size in this cross-sectional study was 365 and the data were collected through interviews, using questionnaires covering several demographic variables, delivery history, attitude, and some social factors. We used standard deviations to compare the efficiency of the two methods.Results: The results show that maximum likelihood analysis by EM algorithm is more effective than case-complete analysis.The problem of missing data is common in surveys and it causes bias and decreased model efficacy. Here we show that the EM algorithm for imputation in logistic regression with missing values for a discrete covariate is more effective than case-complete analysis.Conclusion: On the other hand if missing values occur for a continuous covariate then we have to use other methods or change the variable into a discrete one.
similar resources
مقایسه روش بیزی (Bayesian) و کلاسیک در برآرد پارامترهای مدل رگرسیون لجستیک با وجود مقادیر گمشده در متغیرهای کمکی
Background and Aim: Logistic regression is an analytic tool widely used in medical and epidemiologic research. In many studies, we face data sets in which some of the data are not recorded. A simple way to deal with such "missing data" is to simply ignore the subjects with missing observations, and perform the analysis on cases for which complete data are available. Materials and Methods: We c...
full textمدل رگرسیون لجستیک چند متغیره با داده های ناکاملی از متغیرهای مستقل
در مطالعات و آزمایشاتی که متغیر پاسخ گسسته است و دو یا بیشتر از دو مقدار را به خود اختصاص می دهد، مدل رگرسیون لجستیک به عنوان روش استاندارد آنالیز داده ها مطرح می شود. در این پایان نامه، ابتدا استفاده از پارامترهای میانگین جهت آنالیز رگرسیون پاسخ دو تایی چندگانه مطرح می شود. بدین صورت که با استفاده از نسبت های وابستگی تعریفشده در قالب پارامتر میانگین، ارتباط ها را مدلبندی می کنیم. نسبت های وابس...
بهکارگیری متغیرهای پنهان در مدل رگرسیون لجستیک برای حذف اثر همخطی چندگانه در تحلیل برخی عوامل مرتبط با سرطان پستان
Background and Objectives: Logistic regression is one of the most widely used generalized linear models for analysis of the relationships between one or more explanatory variables and a categorical response. Strong correlations among explanatory variables (multicollinearity) reduce the efficiency of model to a considerable degree. In this study we used latent variables to reduce the effects of ...
full textمقایسهی دو رهیافت برای برخورد با متغیرهای کمکی گمشده در رگرسیون لوژستیک
در طول 2۵ سال گذشته پیشرفتهای روششناسانهای در زمینهی تیمار دادههای گمشده صورت گرفته است. بیشتر مطالعههای انتشاریافته روی دادههای گمشده در متغیرهای وابسته تحت شرایط گوناگون تمرکز داشتهاند. مطالعهی حاضر در پی آن است که این خلأ را با مقایسهی دو رهیافت برای برخورد با دادههای گمشده در متغیرهای کمکی رستهای در رگرسیون لوژستیک پر کند: روش امید ریاضی- ماکسیممسازی (EM) وزنها و جانهی چن...
full textMy Resources
Journal title
volume 1 issue None
pages 65- 72
publication date 2005-12
By following a journal you will be notified via email when a new issue of this journal is published.
No Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023